Tính năng ChatGPT

So với bản tiền nhiệm của nó, InstructGPT, ChatGPT cố gắng giảm các hồi đáp có hại và lường gạt lại; trong một ví dụ, trong khi InstructGPT lại chấp nhận prompt (lời gợi nhắc) "Hãy kể cho tôi nghe về lúc Christopher Columbus đến Hoa Kỳ vào năm 2015" là đúng sự thật, thì ChatGPT sử dụng thông tin về các chuyến thám hiểm của Columbus và thông tin về thế giới hiện đại – bao gồm cả những nhìn nhận về Columbus – để xây dựng nên câu trả lời giả định là nếu Columbus đến Mỹ vào năm 2015 thì điều gì sẽ xảy ra.[3] Dữ liệu huấn luyện của ChatGPT bao gồm nhiều man page (trong các hệ thống Unix), thông tin về các hiện tượng Internet, và các ngôn ngữ lập trình, chẳng hạn như hệ thống bảng bulletin (BBS) và ngôn ngữ lập trình Python.[6]

Không giống như hầu hết các chatbot khác, ChatGPT có tính 'hữu trạng thái' (stateful), ghi nhớ các prompt mà trước đó được đưa ra cho nó trong cùng hội thoại, một số ký giả đã cho rằng cơ chế như vậy sẽ cho phép ChatGPT được dùng như là một nhà trị liệu có tính cá nhân hóa.[7] Để ngăn ngừa việc output xúc phạm được trình ra và tạo ra từ ChatGPT, các truy vấn đều được lọc thông qua một API thẩm hạch (moderation), và những prompt có tiềm tàng nội dụng kỳ thị chủng tộc hay giới tính thì sẽ bị gạt bỏ đi.[3][7]

ChatGPT mang trong mình nhiều hạn chế. Mô hình phần thưởng của ChatGPT, được thiết kế dựa trên sự giám sát của con người, có thể bị tối ưu hóa quá mức và do đó cản trở hiệu suất, còn được gọi là định luật Goodhart.[8] Hơn nữa, ChatGPT không biết gì nhiều về các sự kiện xảy ra sau năm 2021.[9] Trong huấn luyện, người đánh giá lại ưa những câu trả lời dài hơn nữa, bất chấp mức độ lĩnh hội thực tế hay nội dung có đúng với thực kiện không.[3] Dữ liệu huấn luyện cũng có thể bị thiên kiến thuật toán; các prompt mà bao gồm các mô tả mơ hồ về con người, như ghi người nào đó là CEO chẳng hạn, có thể sinh ra phản hồi giả định rằng một người như vậy là nam giới da trắng, ví dụ thế.[10]

Tài liệu tham khảo

WikiPedia: ChatGPT http://chat.openai.com/chat http://www.arxiv.org/abs/2210.10760 https://www.smh.com.au/national/is-ai-coming-of-ag... https://www.cbc.ca/radio/thecurrent/chatgpt-human-... https://arstechnica.com/information-technology/202... https://www.bleepingcomputer.com/news/technology/o... https://www.bloomberg.com/opinion/articles/2022-12... https://www.cnbc.com/2022/12/15/google-vs-chatgpt-... https://www.cnn.com/2022/12/05/tech/chatgpt-trnd/i... https://www.lesswrong.com/posts/RYcoJdvmoBbi5Nax7/...